SPSS 快速概览:统计函数

本教程将引导你了解 SPSS 的主要统计函数。它们主要与 COMPUTEIF 命令一起使用。请注意,这些都是被试内 (within-subjects) (或“水平”) 函数。

对于被试间 (between-subjects) (或“垂直”) 函数,请参阅 AGGREGATE 命令。

本教程中的所有示例都使用 hospital.sav 数据集,该数据集可免费下载。

SPSS 被试内与被试间函数 被试内与被试间函数。

SPSS 统计函数 - 缺失值 (Missing Values)

SPSS 统计函数仅在其所有输入值均为缺失值 (missing values) 时,返回系统缺失值 (system missing values)。 如果单个输入值为有效值,则输出值也将为有效值。 这适用于本教程中我们将介绍的所有函数。

请记住,SPSS数值函数 (numeric functions) 的情况则相反:后者仅在其所有输入值都有效时才返回有效值。

SPSS 统计函数 - 点运算符 (Dot Operator)

可以为统计函数指定最少数量的有效输入值。 这可以通过在函数后附加一个句点,后跟所需的有效值数量来完成。 例如,compute mean_v = mean.3(v1 to v5). 表示 “仅为 v1 到 v5 上至少有 3 个有效值的个案计算 mean_v。 有效值少于 3 个的个案必须在 mean_v 上获得系统缺失值。”

点运算符可以与本教程中涵盖的所有函数一起使用。 不要忽视它。 尽管它在 SPSS 用户中鲜为人知,但它是一项出色的省时功能。

SPSS 由于点运算符导致的系统缺失 仅为在输入变量上具有至少 3 个有效值的个案计算均值。

数据准备 (Data Preparation)

我们将仅使用数据中的最后 5 个变量。 严格来说,不允许对此类定序变量进行计算。 但是,请参阅 等距假设 (Assumption of Equal Intervals)。 如果我们未能指定用户缺失值 (user missing values),我们在它们上演示的函数可能会返回不正确的值。 因此,我们将通过使用以下 语法 (syntax) 运行 FREQUENCIES 来进行快速检查。 请注意步骤 5 中的 TO 关键字。

***1. 指定数据所在的文件夹。
**
cd 'd:/temp'.

***2. 打开数据文件。
**
get file 'hospital.sav'.

***3. 在输出中显示值和值标签。
**
set tnumbers both.

***4. 检查频率。
**
frequencies doctor_rating to facilities_rating.

***5. 为所有涉及的变量指定 6 作为用户缺失值。
**
missing values doctor_rating to facilities_rating(6).

SPSS MEAN 函数

SPSS MEAN 函数返回变量的均值。 如果存在缺失值,则有效值的总和除以有效值的数量。 下面的语法显示了如何计算被试内均值。

***计算 mean_rating 作为所有 5 个评分的均值。
**
compute mean_rating = mean(doctor_rating to facilities_rating).
exe.

SPSS SUM 函数

SPSS SUM 函数返回多个变量的总和。 在存在缺失值的情况下,返回所有有效值的总和。 请记住,在这种情况下,结果可能有些误导。 另请参阅 SPSS Sum - 警示说明 (SPSS Sum - Cautionary Note)。 下面的语法计算我们的评分变量的被试内总和。

***计算 5 个评分的总和。
**
compute sum_rating = sum(doctor_rating to facilities_rating).
exe.

SPSS MIN 函数

SPSS MIN 函数返回多个值的最小值(最小的值)。 我们通常将 MIN 用于 数值变量 (numeric variables),但从技术上讲,它也可以用于 字符串变量 (string variables)。 下面的语法在我们的评分变量上演示了它。

***计算变量的最小值。
**
compute min_rating = min(doctor_rating to facilities_rating).
exe.

SPSS MAX 函数

SPSS MAX 函数返回多个值的最大值(最大的值)。 就像 MIN 一样,它也可以用于字符串变量。 下面的语法计算评分变量的最大值。

***计算最大评分。
**
compute max_rating = max(doctor_rating to facilities_rating).
exe.

SPSS SD 函数

SPSS SD 函数返回多个变量的标准差 (standard deviation)。 请记住,我们这里指的是被试内标准差。 SPSS 在计算标准差时除以 (n-1)。

计算被试内标准差在调查研究中非常有用,可用于检测答题一致者 (straightliners):对所有问题给出相同答案的受访者在这些问题上的标准差将为零。 这可能表明问题没有得到认真回答,在这种情况下,你可能希望将此类个案从分析中排除。 请参阅 SELECT IFFILTER 以获取最可能的选项。

SPSS SD 函数语法示例

***1. 计算评分变量的被试内标准差。
**
compute sd_rating = sd(doctor_rating to facilities_rating).
exe.

***2. 将答题一致者移动到文件顶部。
**
sort cases by sd_rating.

***3. 从数据中删除答题一致者。
**
select if sd_rating > 0.
exe.

SPSS 被试内标准差用于检测答题一致者 使用 SPSS SD 函数检测潜在的答题一致者。

SPSS VARIANCE 函数

SPSS VARIANCE 函数计算多个变量的被试内方差 (variance)。 它只是标准差的平方。

***计算评分变量的被试内方差。
**
compute variance_rating = variance(doctor_rating to facilities_rating).
exe.

SPSS MEDIAN 函数

最后,SPSS MEDIAN 函数返回多个值的中位数 (median)。 同样,请注意我们指的是被试内中位数。 下面的语法在我们的评分变量上演示了它。

***计算评分变量的被试内中位数。
**
compute median_rating = median(doctor_rating to facilities_rating).
exe.